3  FAIR-Prinzipien berücksichtigen

Die FAIR-Prinzipien sind Richtlinien für die Speicherung und Veröffentlichung wissenschaftlicher Daten. Einen guten Einstieg bieten „Data models to GO-FAIR (2017) und Wilkinson u. a. (2016).

Daten sollen auffindbar, zugänglich, interoperabel und wiederverwertbar sein. Diese vier Eigenschaften werden auf 15 FAIR-Prinzipien abgebildet. Auf der Ebene der vier grundlegenden Eigenschaften bietet Ihnen dieses Kapitel aber einen ersten Einstieg.

Hinweis

In Kapitel 6.3 finden Sie eine Checkliste der 15 FAIR-Prinzipien in einfachem Markdown-Textormat.

3.1 Findable: DOI und Metadaten ergänzen

Die Verwendung von Zenodo zur Vergabe eines digitalen Objektbezeichners (DOI, siehe auch DOI Handbook (2023)) und zur Nutzung von Metadaten sollte im Datenmanagementplan dokumentiert sein. Um die Auffindbarkeit der Daten noch weiter zu verbessern, können Sie folgende Punkte adressieren:

  • Hinterlegen Sie Metadaten in einem standardisierten Format. Bekannte Formate sind z. B. DataCite oder Dublin Core.

  • Machen Sie Angaben zu üblichen Schlagwörtern und standardisierten Vokabularen zu Ihrem Fachgebiet.

Ergänzen Sie bei Bedarf im DMP:

**Auffindbarkeit der Daten:**
  - DOI wird über Zenodo vergeben.  
  - Metadaten nach DataCite-Standard: Titel, Autor, Datum, Lizenz, Beschreibung  
  - Schlagwörter: [Themenrelevante Begriffe, z. B. "Machine Learning", "Umweltdaten"]

3.2 Findable: Suchmaschinen unterstützen

  • GitHub-Projekte werden in der Regel von GitHub automatisch indexiert, so dass sie besser gefunden werden können.

  • Zusätzlich sollten Sie keine unnötigen .gitignore-Einstellungen verwenden.

3.3 Accessible: Langfristige Zugänglichkeit sicherstellen

  • Ergänzen Sie im Datenmanagementplan explizit Angaben zur langfristigen Speicherung über Zenodo und dass die Daten öffentlich zugänglich sind (Open Access).

  • Zeitliche Einschränkungen des Zugriffs können über die den so genannten Embargo-Status in Zenodo geregelt werden.

Ergänzen Sie bei Bedarf im DMP:

**Zugänglichkeit:**  
  - Die Daten sind über Zenodo öffentlich zugänglich (Open Access).  
  - DOI garantiert die dauerhafte Verfügbarkeit.  
  - Einschränkungen des Zugriffs werden über Embargo-Status Optionen von Zenodo geregelt.

3.4 Interoperable: Datenformate und Standards beschreiben

  • Verwenden Sie für Ihre Daten Dateiformate, die eine möglichst einfache maschinelle Verarbeitung erlauben.

    • Es bieten sich offene Formate wie z. B. CSV gemäß Hausenblas u. a. (2014) und JSON gemäß Charollais an.

    • Verzichten Sie auf proprietäre Formate wie z. B. Microsoft Excel (.xlsx-Dateien).

  • Nennen Sie die verwendeten Standards für Daten und Metadaten wie z. B. DataCite und JSON-Schema.

  • Nennen Sie Ontologien oder kontrollierte Vokabulare zur Standardisierung von Fachbegriffen, z. B. MeSH, AGROVOC.

Ergänzen Sie bei Bedarf im DMP:

**Interoperabilität:**  
  - Daten werden in offenen Formaten gespeichert: CSV (Tabellen), JSON (strukturierte Daten)  
  - Metadaten-Standards: DataCite für Beschreibung und DOI-Referenzierung  
  - Ontologien oder kontrollierte Vokabulare zur Standardisierung von Begriffen: Verwendung von [z. B. MeSH, AGROVOC] 

3.5 Reusable: Dokumentation und Lizenzierung beschreiben

Ohne Angabe einer Lizenz können Ihre Daten nicht weiterverwendet werden. Weit verbreitet und üblich sind CC-BY 4.0 für Dokumente und die MIT-Lizenz für ausführbaren Programmcode und Softwareprojekte.

Als recht freizügige Lizenz bietet die MIT-Lizenz ein geringes Risiko im Zusammenspiel mit anderen Lizenzen. Beispielsweise erlaubt sie die Wiederverwendung von Code in proprietärer Software. Creative-Commons-(CC)-Lizenzen sind dagegen nicht für die Nutzung in Software oder Hardware empfohlen (Bals (2024)).

Da Veröffentlichungen von Forschungsdaten häufig auch ausführbaren Code beinhalten, bevorzugen wir im Zweifelsfall die MIT-Lizenz.

Ergänzen Sie bei Bedarf im DMP:

**Wiederverwendbarkeit:**  
  - Lizenz: MIT (erlaubt die Nachnutzung auch in proprietärer Software unter der Bedingung der Namensnennung)  
  - Vollständige Dokumentation der Daten: Methoden, Kontext, verwendete Software (z. B. Python-Skripte mit spezifischen Bibliotheksversionen)
  - README-Datei enthält Anleitungen für die Nachnutzung.

3.6 README-Datei und Metadaten

  • Falls Metadaten generiert werden, kann dies in der README-Datei ergänzt werden (z. B. metadata.txt wird automatisch erzeugt).

  • Python-Skripte oder die Zenodo-API könnten Ihnen dabei helfen.

Ergänzen Sie bei Bedarf in der README-Datei:

## Metadata
The dataset is described using the DataCite metadata schema. Key elements include:  
  - **Title**: Title of the dataset.  
  - **Author(s)**: Name(s) of the contributors.  
  - **Keywords**: Relevant keywords for discoverability.  
  - **Description**: Detailed dataset description, including methodology and tools.  
  - **License**: MIT  
  - **DOI**: [Zenodo DOI link].